WebサービスとAlteryxでダミーの店舗マスタを作成してみた
はじめに
こんにちは。データアナリティクス事業本部 BIチームのkariyaです。
今回は架空のスーパーマーケットのデータを想定し、ダミーの店舗マスタを作成してみます。
今回欲しいデータ
- 店舗IDがある(例:000001)
- 店舗名がある(例:〇〇ストア××店)
- 地方がある(例:関東)
- 100店舗分のデータ
Webサイトで疑似個人情報を生成する
ランダムなデータを生成できるWebサイトを利用して個人情報を生成します。
疑似個人情報データ生成サービス
生成する件数を100件にし、使用許諾条件を確認した上で生成ボタンを押します。
結果をcsvでダウンロードします。
Alteryxでデータ確認&不足項目を追加
ここからはAlteryxで不足項目を追加していきます。ワークフローの全体図はこちらです。
まずはレコードIDツールを使い、6桁の店舗IDを作成します。
店舗IDが作成できました。
次にセレクトツールを使い、列名を変更していきます。
住所は複数列に分かれているので、都道府県名~建物名などの列名をつけます。
今回は都道府県名、市区町村名、町名までを残します。
列名を変更した結果です。
次に、フォーミュラツールで店舗名と地方を作成します。 店舗名は、「〇〇ストア」+ 市区町村名 + 町名 + 「店」で作成します。
地方は、都道府県から地方名を出力するIF文を記述して作成します。 47都道府県分のIF文を手書きするのは大変なので、ChatGPTに手伝ってもらいました。
北海道が東北に入っているなど、微修正は必要ですがすべて自分で書くよりも圧倒的に楽ですね。
これで店舗名と地方の作成ができました。
最後に、セレクトツールで出力が不要な列を削除し、列の順番を見やすいように入れ替えます。
以上で店舗マスタの作成は完了です。
おわりに
個人情報の疑似生成はWebサービスに、長いIf文はChatGPTに任せることで、簡単にダミーデータを作成することができました。
100件程度のデータであれば手作業の作成も無理ではないですが、500件、1000件など大量にダミーデータが欲しい場合や何度もダミーデータを作成したい場合は、今回のようにツール等でデータ作成処理を作ってしまうのが楽だと感じました。
この記事により、データ準備が少しでも楽になれば嬉しいです。